ارائه الگوریتمی برای چالش تشخیص تعاریف مخفف در متن کاوی متون زیست پزشکی

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی کامپیوتر
نویسنده احمد قلیچی
استاد راهنما جمال شهرابی احمد فراهی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1391

چکیده

یکی از زمینه هایی که در طی چند سال اخیر مطرح شده، بحث جستجو و استخراج داده ها از متون مختلف می باشد. از جمله این متون، متون زیست پزشکی (بیومدیکال) می باشند که به صورت مقاله ها و نوشته هایی در اینترنت موجود می باشند. اندازه و نرخ رشد منابع زیست پزشکی باعث ایجاد چالش های جدیدی برای محققان و پژوهشگرانی که نیاز به بروز شدن دارند، شده است. تکنیک های متن کاوی که شامل فرآیندهای بازیابی اطلاعات، استخراج اطلاعات و داده کاوی است، راه های پاسخ به این مسأله را هموار می کند. این تکنیک ها با افزودن معنی به متن، در مقایسه با جستجوی ساده ی لغات، تحلیل معتبرتری از اطلاعات متنی ارائه می دهد. استخراج درست مخفف ها و تعاریفشان برای زیست شناسی خیلی مهم و مفید می باشد. یکی از موارد مرتبط با این زمینه، نرخ بالای مخفف های جدیدی است که در متون زیست پزشکی معرفی، ایجاد و رخ می دهند. پایگاه داده ها، آنتولوژی ها و فرهنگ لغت های موجود باید با مخفف های جدید و تعاریفشان به طور پیوسته بروز باشند. در تلاشی که برای حل این مشکل انجام شده است تکنیک های جدیدی معرفی شده اند که به صورت خودکار، مخفف ها را به همراه تعاریف آن ها از چکیده های مدلاین استخراج می کنند. چهار روش برای این کار وجود دارد: روش های مبتنی بر آمار، قانونمند، یادگیری ماشین و ترازبندی متن. سه روش اول در یافتن مخفف های بی قاعده به مشکل برخوردند ولی روش ترازبندی متن با طرح امتیازدهی و ترکیبی از تکنیک ها و الگوریتم ها می تواند تا حدودی بر این مشکل غلبه کند. در این تحقیق ما یک الگوریتم ترازبندی ترکیبی را برای استخراج مخفف ها از متون زیست پزشکی پیشنهاد کرده ایم. روش کار شناسایی زوج های فرم کوتاه و فرم بلند می باشد که در آن از هر نوعی از کاراکترهای فرم کوتاه یک نگاشت به فرم بلند انجام می شود. در این الگوریتم بعضی مخفف های بی قاعده ایی که با روش های پیشین یافت نمی شد، پیدا می شود. با ارزیابی این الگوریتم مشخص شد الگوریتم دقت بالایی را نسبت به الگوریتم های قبلی نشان می دهد.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه الگوریتمی برای تشخیص کجی تصاویراسناد فارسی

تشخیص کجی تصاویر اسناد، یکی از مراحل مهم در سیستم¬های نرم¬افزاری شناسایی و تحلیل اسناد است، اکثر روش¬های آنالیز اسناد، به کجی تصویر سند حساس هستند و حتی اگر زاویه انحراف کوچک باشد نیز موجب کاهش شدید کارآیی آن¬¬ها می¬شود. علاوه بر این، اکثرالگوریتم¬های ارائه شده در این زمینه، برای تشخیص کجی تصویر در اسناد لاتین به کار رفته¬اند و با اینکه مشکل کجی برای اسناد لاتین تا حدودی مرتفع شده است، ولی به د...

15 صفحه اول

انسجام متن تعاریف در کتابهای درسی دانشگاهی

«تعریف» اصطلاحات و واژه‌ها بخش اساسی و جدایی‌ناپذیر کتاب درسی دانشگاهی است و منبعی است برای یادگیری. این جستار تلاشی است در جهت کاربرد مفاهیم زبان‌شناسی متن و نظریة نقش‌گرای هلیدی در توصیف «تعریف» که سنتاً با رویکردهای منطقی و فلسفی بررسی شده است. نگارندگان در پی آن هستند با آسیب‌شناسی نمونه‌ای از تعاریف مندرج در کتابهای درسی دانشگاهی، بابی را برای نقد و ارزیابی روشمند این مقوله بگشایند.این مقال...

متن کامل

چالش های آموزش الکترونیکی در علوم پزشکی: مروری بر متون

Background and objective:  Extension of knowledge and information is given a new meaning to the concept of education. One of The most important reasons for the use of e-learning in medical education is that learning is learned by the learners themselves. This method facilitates their individualized education programs. This study introduced   the challenges and solutions for the a...

متن کامل

ارائه الگوریتمی جدید برای مدلسازی پیشرو سه بعدی در مگنتوتلوریک

متن کامل

ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن کاوی در حوزه یادگیری الکترونیکی

هنگامی که شبکه های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش های متن کاوی استفاده می شود. متن کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد ز...

متن کامل

تشخیص صحیح کلمات هم آوا در متون فارسی با استفاده از تکنیک متن کاوی

نوشتار کلمات فارسی به دلیل وجود حروف هم آوا پیچیده می باشد. افراد برای یادگیری املای کلمات باید با تمرین و ممارست آن را بیاموزند. نرم افزارهایی تحت عنوان غلط یاب جهت بررسی املای کلمات فارسی ارائه شده اند که با مقایسه نوشتار کلمات با دانش موجود در نرم افزار، صحت آنها را تشخیص می دهند. در این میان صحت برخی کلمات بر اساس متن مشخص می-شود (ممکن است کلمات از نظر املایی صحیح، ولی بر اساس متن جمله اشتب...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی کامپیوتر

کلمات کلیدی

داده کاوی مخفف های زیست پزشکی متن کاوی متون زیست پزشکی

میزبانی شده توسط پلتفرم ابری doprax.com